如何利用跨区域网络将分布式数据中心连接成大型 AI 工厂
AI 技术日益复杂,训练与推理领域的新进展对数据中心提出了更高的要求。随着数据中心算力的迅速提升,数据中心基础设施逐渐受到了和算法和模型无关的基础物理条件的限制,如电力供应、散热能力以及空间限制等,制约了 AI 工厂的物理扩展。为了持续增长,在构建新的数据中心
AI 技术日益复杂,训练与推理领域的新进展对数据中心提出了更高的要求。随着数据中心算力的迅速提升,数据中心基础设施逐渐受到了和算法和模型无关的基础物理条件的限制,如电力供应、散热能力以及空间限制等,制约了 AI 工厂的物理扩展。为了持续增长,在构建新的数据中心
过去几年,新华三在智算基础设施建设中总结出一组数据:尽管智算网络在智算中心整体投资里面仅占约10%,但作用却远超预期。数据显示,同样搭载先进算力,与未经调优的智算网络相比,调优后的网络能让智算中心的训练性能提升30%,模型训练用时缩短25%,并有效避免因网络故